走向数据科学领域信息情报检索

在数据科学领域分享概念、思想和代码。Towards Data Science Inc.是一家在加拿大注册的公司。它为成千上万的人提供了一个交流思想、扩展对数据科学理解的平台。

我本月学到的机器学习课程

The Machine Learning Lessons I’ve Learned This Month

圣诞节联系、副驾驶的成本、谨慎的(无)选择这篇文章《我本月学到的机器学习课程》首先出现在《迈向数据科学》上。

机器学习“降临节日历”第一天:Excel 中的 k-NN 回归器

The Machine Learning “Advent Calendar” Day 1: k-NN Regressor in Excel

降临节日历的第一天介绍了 k-NN 回归器,这是最简单的基于距离的模型。使用 Excel,我们探讨了预测如何完全依赖于最接近的观测值、为什么特征缩放很重要,以及异构变量如何使距离变得毫无意义。通过具有连续和分类特征的示例(包括加州住房和钻石数据集),我们看到了 k-NN 的优点和局限性,以及为什么定义正确的距离对于反映现实世界的结构至关重要。机器学习“降临日历”第一天:Excel 中的 k-NN 回归器一文首先出现在《走向数据科学》上。

人工智能浏览器的问题:安全缺陷和隐私的终结

The Problem with AI Browsers: Security Flaws and the End of Privacy

Atlas 和大多数当前的人工智能浏览器如何在三个方面失败:隐私、安全和审查制度人工智能浏览器的问题:安全缺陷和隐私的终结首先出现在《走向数据科学》上。

学习、黑客攻击和运输 ML

Learning, Hacking, and Shipping ML

Vyacheslav Efimov 谈论 AI 黑客马拉松、数据科学路线图以及 AI 如何有意义地改变 ML 工程师的日常工作学习、黑客和运输 ML 帖子首先出现在走向数据科学上。

为什么人工智能调整始于更好的评估

Why AI Alignment Starts With Better Evaluation

你无法调整你不评估的东西“为什么人工智能调整从更好的评估开始”一文首先出现在《走向数据科学》上。

机器学习和深度学习“降临日历”系列:蓝图

The Machine Learning and Deep Learning “Advent Calendar” Series: The Blueprint

直接在 Excel 中逐步打开 ML 模型的黑匣子机器学习和深度学习“降临日历”系列:蓝图首先出现在走向数据科学上。

贪婪 Boruta 算法:在不牺牲召回率的情况下加快特征选择

The Greedy Boruta Algorithm: Faster Feature Selection Without Sacrificing Recall

对 Boruta 算法的修改,可在保持高灵敏度的同时显着减少计算量《贪婪的 Boruta 算法:更快的特征选择而不牺牲召回率》一文首先出现在《走向数据科学》上。

指标欺骗:当您的最佳 KPI 隐藏您最严重的失败时

Metric Deception: When Your Best KPIs Hide Your Worst Failures

最危险的 KPI 并未被打破;即使他们失去了意义,他们仍然是值得信赖的人。 后《指标欺骗:当你最好的 KPI 隐藏你最糟糕的失败时》首先出现在《走向数据科学》上。

2026 年的数据科学:还值得吗?

Data Science in 2026: Is It Still Worth It?

10年AI工程师的真实观点2026年的后数据科学:还值得吗?首先出现在《走向数据科学》上。

为什么多年来我们一直在优化法学硕士中的错误内容

Why We’ve Been Optimizing the Wrong Thing in LLMs for Years

训练中的简单转变可以释放远见、更快的推理和更好的推理。为什么我们多年来一直在法学硕士中优化错误的事情,这篇文章首先出现在《走向数据科学》上。

产品运行状况评分:我如何通过统一监控和 n8n 自动化将严重事件减少 35%

The Product Health Score: How I Reduced Critical Incidents by 35% with Unified Monitoring and n8n Automation

产品、增长和工程团队如何融合单一信号以实现更好的事件管理产品健康评分:我如何通过统一监控和 n8n 自动化将关键事件减少 35% 的帖子首先出现在 Towards Data Science 上。

TDS 时事通讯:11 月有关 GraphRAG、ML 项目、LLM 支持的时间序列分析等的必读内容

TDS Newsletter: November Must-Reads on GraphRAG, ML Projects, LLM-Powered Time-Series Analysis, and More

不要错过我们过去一个月阅读量最大的故事TDS 新闻通讯:11 月有关 GraphRAG、ML 项目、LLM 驱动的时间序列分析等的必读文章首先出现在 Towards Data Science 上。

神经网络是模糊的,符号系统是支离破碎的。稀疏自动编码器帮助我们将它们组合起来。

Neural Networks Are Blurry, Symbolic Systems Are Fragmented. Sparse Autoencoders Help Us Combine Them.

神经模型和符号模型以根本不同的方式压缩世界,而稀疏自动编码器 (SAE) 提供了连接它们的桥梁。后神经网络是模糊的,符号系统是支离破碎的。稀疏自动编码器帮助我们将它们组合起来。首先出现在《走向数据科学》上。

饮水机闲聊,第一集。 10:那么,人工智能泡沫呢?

Water Cooler Small Talk, Ep. 10: So, What About the AI Bubble?

我们是否都被欺骗了,相信了一个不可能的、极其昂贵的未来? 10:那么,人工智能泡沫呢?首先出现在《走向数据科学》上。

日常决策比您想象的更嘈杂 - 以下是人工智能如何帮助解决这个问题

Everyday Decisions are Noisier Than You Think — Here’s How AI Can Help Fix That

从保险费到法庭:噪音的影响《日常决策比你想象的噪音更大——人工智能如何帮助解决这个问题》一文首先出现在《走向数据科学》上。

用 Python 实现剪刀石头布游戏

Implementing the Rock Paper Scissors Game in Python

使用条件和随机模块的初学者友好的 Python 教程《用 Python 实现石头剪刀布游戏》一文首先出现在《走向数据科学》上。

我使用 Pandas 清理了一个凌乱的 CSV 文件。这是我每次都遵循的确切流程。

I Cleaned a Messy CSV File Using Pandas .  Here’s the Exact Process I Follow Every Time.

停止猜测数据清理。使用这个可重复的 5 步 Python 工作流程来诊断和修复最常见的数据缺陷。帖子我使用 Pandas 清理了凌乱的 CSV 文件。这是我每次都遵循的确切流程。首先出现在《走向数据科学》上。

RISAT的无声承诺:用合成孔径雷达解码灾难

RISAT’s Silent Promise: Decoding Disasters with Synthetic Aperture Radar

高分辨率物理学将微波回波转化为实时洪水情报RISAT 后的《无声承诺:用合成孔径雷达解码灾难》首先出现在《走向数据科学》上。